Obiettivi di Apprendimento
- Analizzare i limiti degli RNN e degli LSTM nel gestire dipendenze a lungo raggio
- Definire le basi matematiche del meccanismo di Self-Attention
- Scomporre l'architettura Transformer encoder-decoder e i suoi componenti
- Valutare il ruolo della codifica posizionale e dell'attenzione multi-testa nel modellamento delle sequenze